基本介紹
Pandas是一個基於Numpy,用來進行資料處理及分析的強大工具,它不僅提供了Series 、DataFrame等十分容易使用的資料結構物件,並且提供了許多好用的工具、函數與功能。
Pandas使用前請先匯入模組,並設定別名pd
import pandas as pd
Pandas的Series 為一維的資料陣列,DataFrame則為二維資料陣列。本日首先介紹使用串列及字典建立一維的資料陣列Series 以及如何取值。
一、建立Series
1.使用串列建立Series
pd.Series(資料,index=索引)
資料可用串列(list)、元組(tuple)、字典(dictionary)、或Numpy陣列。index參數是可選填的,預設為整數串列。
import pandas as pd
se=pd.Series([1,2,3,4,5,])
print(se)
結果顯示如下
0 1
1 2
2 3
3 4
4 5
dtype: int64
2.使用字典建立Series
import pandas as pd
dict1={'小明':'律師','小美':'教師','小英':'美容師','小翔':'醫師'}
se=pd.Series(dict1)
print(se)
結果顯示如下
小明 律師
小美 教師
小英 美容師
小翔 醫師
dtype: object
二、Series取值
1.串列
(1)預設索引取值
import pandas as pd
se=pd.Series([1,2,3,4,5,])
print(se[3]) #顯示第4個數字
print(se[3:5]) #顯示第4-5個數字
結果顯示如下
4
3 4
4 5
dtype: int64
(2)自訂索引取值
import pandas as pd
se=pd.Series([1,2,3,4,5,],index=['a','b','c','d','e'])
print(se)
print(se['c']) #顯示第3個數字
print(se['c':'d']) #顯示第3-4個數字
結果顯示如下
a 1
b 2
c 3
d 4
e 5
dtype: int64
3
c 3
d 4
dtype: int64
2.字典
用字典新增的Series物件,字典的鍵成為索引,值成為資料。
import pandas as pd
dict1={'小明':'律師','小美':'教師','小英':'美容師','小翔':'醫師'}
se=pd.Series(dict1)
print(se) #顯示Series
print(se.values) #顯示值
print(se.index) #顯示索引
print(se['小明']) #用索引取值
print(se['小明':'小美']) #用索引範圍取值
結果顯示如下
小明 律師
小美 教師
小英 美容師
小翔 醫師
dtype: object
['律師' '教師' '美容師' '醫師']
Index(['小明', '小美', '小英', '小翔'], dtype='object')
律師
小明 律師
小美 教師
dtype: object
認識完一維的Series,接下來我們明天再來了解如何建立二維的DataFrame。